👌 Как правильно инициализировать центроиды в k-means, чтобы не застрять в плохом локальном минимуме
Простая случайная инициализация (выбор k случайных точек из данных) может привести к плохому результату, особенно если точки окажутся слишком близко друг к другу или не отражают структуру данных.
🔥 Лучшее решение — использовать алгоритм k-means++
Он работает так: 1. Сначала выбирается одна случайная точка из данных. 2. Далее каждый следующий центр выбирается с вероятностью, пропорциональной квадрату расстояния до ближайшего уже выбранного центра.
Такой подход равномерно распределяет центры и уменьшает риск плохой сходимости. В большинстве случаев он ещё и ускоряет обучение.
💡В сложных случаях (например, потоковые данные или неустойчивое распределение) можно использовать: — Инициализацию на основе иерархической кластеризации. — Несколько прогонов с разными начальными условиями и выбор лучшего результата по ошибке.
👌 Как правильно инициализировать центроиды в k-means, чтобы не застрять в плохом локальном минимуме
Простая случайная инициализация (выбор k случайных точек из данных) может привести к плохому результату, особенно если точки окажутся слишком близко друг к другу или не отражают структуру данных.
🔥 Лучшее решение — использовать алгоритм k-means++
Он работает так: 1. Сначала выбирается одна случайная точка из данных. 2. Далее каждый следующий центр выбирается с вероятностью, пропорциональной квадрату расстояния до ближайшего уже выбранного центра.
Такой подход равномерно распределяет центры и уменьшает риск плохой сходимости. В большинстве случаев он ещё и ускоряет обучение.
💡В сложных случаях (например, потоковые данные или неустойчивое распределение) можно использовать: — Инициализацию на основе иерархической кластеризации. — Несколько прогонов с разными начальными условиями и выбор лучшего результата по ошибке.
At a time when the Indian stock market is peaking and has rallied immensely compared to global markets, there are companies that have not performed in the last 10 years. These are definitely a minor portion of the market considering there are hundreds of stocks that have turned multibagger since 2020. What went wrong with these stocks? Reasons vary from corporate governance, sectoral weakness, company specific and so on. But the more important question is, are these stocks worth buying?
Библиотека собеса по Data Science | вопросы с собеседований from it